Vorhersage der Suchwortwahl von professionellen Rechercheuren in Literaturdatenbanken durch assoziative Wortnetze
نویسنده
چکیده
An associative lexical net is constructed to predict the selection of terms used in 94 professional, request based searches in a bibliographic data base. The weights of the net are calculated by a proportional learning rule, using the frequencies of co-occurence of terms in the free text fields of the 246,889 documents of the retrieval system PsycLIT (1989). To evaluate the results of the simulation the mean ranks of three classes of terms are calculated: Those terms that appear in both, the request and the query obtain a mean rank of 19 out of 872, those which appear in the query but not in the request, the new words, obtain a mean rank of 164, and those terms, that are not used in the query but appear in the request obtain a mean rank of 199. Zusammenfassung Mit einem assoziativen Wortnetz wird die Wortwahl bei 94 professionellen Recherchen, die aufgrund von schriftlichen Nutzeranfragen in einer Literaturdatenbank durchgeführt wurden, simuliert. Das Vokabular des Wortnetzes wurde auf der Basis der Anfragen und Recherchen konstruiert. Die Gewichte zwischen den Termen des Vokabulars wurden aus den Häufigkeiten des gemeinsamen Auftretens der Terme in den Freitextfeldern der Datenbank PsycLIT (1989) berechnet. Zur Bewertung der Simulationsergebnisse wurden die mittleren Rangplätze von drei Termklassen berechnet: Die Terme, die jeweils in der Anfrage und der zugehörigen Recherche auftauchen, erhielten bei 872 Termen einen mittleren Rang von 19, die, die in der Recherche auftauchen aber nicht in der Anfrage, erzielten einen mittleren Rang von 164, und die Terme, die nicht in die Recherche übernommen wurden, die also nur in der Anfrage auftauchen, lagen im Mittel auf Rang 199. Diese Arbeit wurde vom Heinz-Nixdorf-Institut unterstützt 1. Wortwahl, Assoziationstheorie und Wortnetze Zur Untersuchung der Interaktion zwischen Mensch und Maschine gehört insbesondere die Untersuchung des Verhaltens von Maschinenbenutzern in spezifischen Arbeitssituationen. Im Folgenden wird ein assoziatives Modell zur Untersuchung der Wortwahl von professionellen Rechercheuren einer Literaturdatenbank bei der Generierung von Datenbanksuchfragen vorgestellt. Dabei wird zum einen die Auswahl von Worten aus natürlichsprachlichen schriftlichen Anfragen an die Datenbank untersucht, zum anderen die Wahl von Suchtermen, die nicht in der schriftlichen Anfrage vorkommen. Die Wahl der verwendeten Suchterme wird mit der assoziativen Lerntheorie erklärt und durch ein daraus entwickeltes assoziatives Wortnetz mit gutem Erfolg simuliert. Die erfolgreiche Simulation der Wortwahl kann die Basis für eine interaktive Unterstützung von Rechercheuren oder eine Automatisierung der Suchtermgenerierung legen. 1.1. Assoziative Prozesse Bei der Durchführung einer Recherche zu einer schriftlichen Anfrage müssen aus der Information der Anfrage Suchfragen in der Abfragesprache der Datenbank generiert werden. Dabei lassen sich zwei Arten von Prozessen unterscheiden: zum einen die Prozesse der Wortwahl, zum anderen die der Konstruktion der Suchfragen aus den gewählten Wörtern. Während es sich bei dem letzteren eher um einen regelgeleiteten Prozeß handelt, scheint die Wortwahl wesentlich durch assoziative Prozesse bestimmt. Die Assoziationstheorie nimmt an, daß Dinge, die häufig zusammen wahrgenommen werden, im Gedächtnis derart miteinander verbunden sind, daß, wenn eines der beiden Dinge als Stimulus wahrgenommen oder erinnert wird, auch das andere erinnert wird. Auf die Sprache bezogen bedeutet das, daß Worte, die häufig zusammen auftreten, assoziativ verbunden sind, und umgekehrt, daß Worte, die assoziativ verbunden sind, in der Sprache häufig zusammen gebraucht werden. Zweifellos lassen sich viele Eigenschaften der Sprache, wie z. B. die syntaktische Struktur, mit diesem einfachen Ansatz nur schwer erklären, aber für die Vorhersage der Wortwahl scheint er geeignet zu sein. Das assoziative Modell der Wortwahl läßt sich so zusammenfassen: Durch die Wahrnehmung von (fachspezifischer) Sprache werden im Laufe der Zeit (fachspezifische) Assoziationen zwischen den Wörtern der (Fach-) Sprache gelernt. Wird nun eine Anfrage gelesen, so werden die Wörter der Anfrage aktiviert. Diese Aktivierung setzt sich über die Assoziationen zum einen auf neue Wörter fort, die stark mit den aktivierten Wörtern der Anfrage verbunden sind, zum anderen stabilisieren sich die Aktivitäten von Wörtern, die stark untereinander verbunden sind, gegenseitig, während Wörter, die nur schwach mit den anderen aktivierten Wörtern verbunden sind, ihre Aktivierung verlieren. Als Suchterme werden schließlich die Wörter mit einer hohen Aktivierung verwendet. 1.2. Assoziative Wortnetze Zur Modellierung dieses Ansatzes läßt sich ein sogenanntes assoziatives Wortnetz verwenden. Ein solches Netz besteht aus einer Menge von Knoten, denen eine reellwertige “Aktivierung” zugeordnet ist, und einer Menge von Verbindungen zwischen je zwei Knoten, denen ebenfalls je eine reelle Zahl als “Gewicht” zugeordnet ist. Den Knoten werden Wörter zugeordnet, die Gewichte zwischen zwei Knoten leiten sich aus den Assoziationen zwischen den Wörtern her. Ein assoziativer Prozeß wird als Ausbreitung von Aktivierungen auf dem Netz simuliert: Die Aktivitätswerte der Knoten, die dem Stimuluswort zugeordnet sind, werden erhöht und anschließend wird für jeden Knoten des Netzes ein neuer Aktivitätswert als Funktion der Verbindungsgewichte und der Aktivitäten der anderen Knoten berechnet. Dabei können die genauen Regeln der Aktivitätsausbreitung von Modell zu Modell verschieden sein. In dem in dieser Untersuchung verwendeten linearen Modell besteht zwischen jedem Knotenpaar eine Verbindung, und der neue Wert eines Knotens ist die Summe der mit den jeweiligen Verbindungsgewichten multiplizierten Aktivitäten der anderen Knoten. Das entspricht der Multiplikation eines Vektors, der die Aktivierungen der Knoten enthält, mit einer quadratischen Matrix, die die Gewichte der Verbindungen zwischen den Knoten enthält.
منابع مشابه
Verteilte Messung und Vorhersage von Kanalauslastung in IEEE 802.11 Wireless LAN
Aufgrund der hohen Verbreitung und intensiven Nutzung von WLAN kommt es insbesondere in Bereichen mit hoher Gerätedichte (wie z. B. universitären Lehrgebäuden) schon heute zu Kapazitätsengpässen, die durch ausgelastete Funkkanäle verursacht werden. Eine Vorhersage der Funkkanalauslastung kann die Probleme durch bessere Nutzung der vorhanden Spektrumsressourcen und proaktive Anpassung genutzter ...
متن کاملNetzwerke - Das Organisationsprinzip der Wissenschaften
Wissenschaftliche Kooperationen schlagen sich oft in gemeinsamen Veröffentlichungen nieder, die von großen Literaturdatenbanken erfasst werden. Somit werden Literaturdatenbanken, wie z.B. das Web of Science des Institute of Scientific Information (ISI) zu wichtigen Quellen von Daten über die spontane Organisation von Wissenschaftlern. Daten werden jedoch erst durch ihre Verarbeitung zu Informat...
متن کاملKomplexe Objektbeschreibungen Zur Suche in Multimedia-datenbanken Datenbank-spektrum 19/2006 1 1 Einleitung
Die inhaltsbasierte Suche nach Multimediadaten, wie Fotos, Musikstücken oder Filmen, hat durch die jüngsten Entwicklungen in der Unterhaltungselektronik, der Datenübermittlung und der Computertechnologie an allgemeinem Interesse gewonnen. Während früher die Verwaltung großer Mengen von Multimediadaten eher professionellen Anwendern vorbehalten war, existieren heute in vielen Haushalten mehrere ...
متن کاملVorhersage des Krankheitsverlaufes von leichten kognitiven Beeinträchtigungen durch automatisierte MRT Morphometrie
Kurzfassung. Die leichte kognitive Beeinträchtigung (LKB) gilt als Anzeichen für ein erhöhtes Risiko der Entwicklung einer Alzheimerdemenz. Eine fundierte klinische Prognose für den Krankheitsverlauf kann aber bis dato nicht gegeben werden. Das Ziel dieser Arbeit besteht darin, eine möglichst präzise Vorhersage mittels automatisierter Morphometrie des Hippokampus im MRT-Bild zu treffen. In eine...
متن کاملQualitative Bewertung von Automotive Services durch Simulation
Automotive Services stellen ein wichtiges Differenzierungsmerkmal der Automobilhersteller dar und gewinnen zunehmend an Bedeutung. Um ihre Kunden nicht aufgrund mangelnder Dienstqualität zu verärgern, wird nach einer Möglichkeit gesucht, die zu erwartende Dienstgüte bereits im Voraus bestimmen zu können. In diesem Beitrag beschreiben wir einen Ansatz zur qualitativen Bewertung von Automotive Se...
متن کامل